评估指标

Nd113 C7 46 L 评估指标

00:00

准确性

分类模型的准确性是通过比较预测标签和真实标签来实现的。对于任何给定的图像，如果 predicted_label 匹配 true_label ，那么这是一个正确分类的图像；否则，这就是错误分类。

准确度由正确分类的图像的数量除以图像的总数量得到。我们将在新图像上测试这个分类模型，这被称为测试数据集。

测试数据

测试数据是以前看不见的图像数据。你已经看到的数据，以及你用来帮助构建分类器的数据称为训练数据，我们之前提过。创建这些数据集的想法是，创建一个能够正确分类所有这些训练图像的分类器，以及了解分类器如何在真实世界的一般情况下工作。你可以想象正在浏览训练集的图像，并创建一个能够正确分类所有这些训练图像的分类器。但是，实际上，你会创建一个分类器， 能够识别数据的一般模式 。所以当它面对现实世界的情景时，它仍然会工作！
因此，我们使用新的测试数据集，来查看分类模型在现实世界中的工作方式，并确定模型的准确性。

错误分类的图像

在这个和大多数分类的例子中，测试集中有一些错误分类的图像。要看如何改进，了解这些错误分类的图像很有用。看看哪些地方被错误标记，以及这种模型在哪些地方有问题。这将取决于你看这些图像，并考虑如何改进分类模型！